| Спецкурс | MаLы DаLи | ||
| Основная информация | |||
| № | Пункт | Содержание | |
| 1 | Направление | Третий Путь | |
| 2 | Класс | 10 - 11 | |
| 3 | Тип курса | зачётный только для 10-11-ти классников | |
| 4 | Преподаватели | Куратцев Владимир, Кадерова Надия | |
| 5 | Стажёры | ||
| 6 | Время проведения | Среда 18:55 - 20:15 | |
| 7 | Цель курса | Познакомить школьников с основами науки о данных (Data Science) и научить применять знания на практике с конкретными типами задач из Machine Learning и Deep Learning | |
| 8 | Задачи курса | 1. Дать общее представление об истории Data Science 2. Познакомить с основами Python для Data Science 3. Познакомить с основами Data Science (ML,DL) 4. Познакомить с разными типами задач и примерами их решения 5. Дать возможность самостоятельной реализации задач и проектов по Data Science с поддержкой преподавателей |
|
| 9 | Особенности курса | Адаптированный для школьников курс по Data Science (Machine Learning и Deep Learning). Возможность практики на конкретных задачах и реализации своего проекта с поддержкой преподавателей. Для прохождения курса необходимо наличие дома доступа к компьютеру и интернету. По желанию школьников можно приносить на занятия ноутбук для отработки навыков параллельно лекции | |
| 10 | Формат проведения занятия (включая использование classroom) | 1) Совмещенный формат: лекция + семинар. Лекционный материал от
преподавателя, разбор кода и параллельное его написание школьниками в
компьютерном классе; 2) Особые виды занятий (экзамен или чаепитие) |
|
| 11 | Целевая аудитория | Школьники 10-11 классов, заинтересованные в изучении Data Science и имеющие уверенные знания в математике и программировании | |
| 12 | Краткое описание курса | Адаптированный для школьников 10-11 классов курс науки о данных (Data Science) | |
| 13 | Количество слушателей | от 10 до 20 человек | |
| 14 | Отбор | Отбор будет. Письменная работа из задач по математике, информатике, программированию. Задания не привязаны к конкретному языку программированию | |
| 15 | Формы
контроля и система отчётности |
1. Посещение - 20% 2. Домашняя работа (мини-задачи для практики на основе пройденного материала) - 30% 3. Письменный экзамен - 20% 4. Проект (самостоятельная практическая работа, посвященная решению одного из разобранных на лекциях типов задач на конкретном примере данных) - 30% |
|
| 16 | Формат курса: онлайн/оффлайн/гибрид. В случае онлайн, какие платформы используются? | оффлайн | |
| 20 | Дополнительная информация о курсе | ||
| Позанятийный план | |||
| № занятия | Дата (Среда) | Тематический блок | План занятия |
| 1 | 02.10.2024 | Введение. Отбор. | Обсуждение организационных вопросов. Проведение отбора. |
| 2 | 09.10.2024 | Введение | Введение в историю науки о данных, ее структура и методы. |
| 3 | 16.10.2024 | Python | Вводное занятие по программированию. Организация работы в компьютерном классе. Google Collab. Anaconda и Jupiter Notebook. Работа с нейросетью (например, Phind, GigaChat) для помощи с написанием кода. |
| 4 | 23.10.2024 | Python | Основы синтаксиса. Переменные и типы данных. Математические операции. |
| 5 | 30.10.2024 | Python | Основные структуры: условные конструкции, циклы и функции. Библиотека pandas. Предобработка данных: работа с пропусками. |
| 6 | 06.11.2024 | Python | Предобработка данных: работа с типами данных, дубликатами. Библиотека matplotlib. Основы визуализации данных. |
| 7 | 13.11.2024 | Элементы математической статистики | Введение в статистику: вероятность, случайные величины и их распределения, математическое ожидание, дисперсия, медиана, ковариация, корреляция, регрессия. |
| 8 | 20.11.2024 | Элементы математической статистики | Выборочные характеристики, точечные оценки и их свойства. Методы построения оценок: ММ, ММП, МНК. |
| 9 | 27.11.2024 | Машинное обучение | Введение в машинное обучение. Задача регрессии. Библиотека scikit-learn. Разбиение данных на выборки. Линейная регрессия. Оценка качества модели регрессии. |
| 10 | 04.12.2024 | Машинное обучение | Обработка количественных и категориальных признаков. Анализ ошибок модели. Дедлайн №1 по выбору задачи. |
| 11 | 11.12.2024 | Машинное обучение | Задача классификации. Логистическая регрессия. Оценка качества модели классификации. Дедлайн №2 по структуре проекта. |
| 12 | 18.12.2024 | Машинное обучение | Метод опорных векторов. Дерево решений. Дедлайн №3 по коду проекта. |
| 13 | 25.12.2024 | Машинное обучение | Переобучение и недообучение. Регуляризация. Решения проблемы дисбаланса классов. Кросс-валидация. Дедлайн №4 по результатам. |
| 01.01.2025 | - | ||
| 08.01.2025 | - | ||
| 14 | 15.01.2025 | Экзамен | Защита проекта (выступление с презентацией) и письменный экзамен |
| 15 | 22.01.2025 | Чаепитие | Чаепитие |
| 16 | 29.01.2025 | Машинное обучение | Задача понижения размерности. Проклятие размерности. Метод главных компонент. t-SNE. |
| 17 | 05.02.2025 | Машинное обучение | Задача кластеризации. Сложности постановки задачи. Метод K-Means. |
| 18 | 12.02.2025 | Машинное обучение | Иеархическая кластеризация. DBSCAN. |
| 19.02.2025 | - | ||
| 19 | 26.02.2025 | Глубокое обучение | Введение в нейронные сети. Структура нейрона. Определение нейронной сети. Виды нейронных сетей. Полносвязные нейронные сети. |
| 20 | 05.03.2025 | Глубокое обучение | Сверточные нейронные сети (CNN). Архитектура CNN. Введение в библиотеку PyTorch. Решение задачи классификации с помощью нейронных сетей. |
| 21 | 12.03.2025 | Глубокое обучение | Реализация CNN для задачи классификации в выбранном фреймворке. Оценка модели. |
| 22 | 19.03.2025 | Глубокое обучение | Задача распознавания звуков. Особенности и характерные признаки. Принцип работы CNN при обработке аудиоданных. |
| 23 | 26.03.2025 | Глубокое обучение | Реализация CNN для задачи распознавания звуков в выбранном фреймворке. Оценка модели. Эксперименты с различными параметрами. Дедлайн №1 по выбору задачи. |
| 24 | 02.04.2025 | Глубокое обучение | Структура нейронной сети для задачи регрессии. Роль активационных функций. Описание архитектур для регрессии. Применение выбранной модели для решения задачи регрессии. Оценка точности и других метрик качества. Дедлайн №2 по структуре проекта. |
| 25 | 09.04.2025 | Глубокое обучение | Определение временного ряда. Основные статистические характеристики временных рядов. Реккурентные нейронные сети. Принцип работы, особенности и преимущества. Применение обученной нейронной сети для прогнозирования временного ряда. Оценка производительности модели и сравнение со статистическими методами. Дедлайн №3 по коду проекта. |
| 26 | 16.04.2025 | Глубокое обучение | Определение автоэнкодера. Назначение автоэнкодера. Архитектура автоэнкодера. Метрики оценки качества сжатия. Примеры использования автоэнкодеров для сжатия изображений. Дедлайн №4 по результатам. |
| 27 | 23.04.2025 | Глубокое обучение | Защита проекта (выступление с презентацией) и письменный экзамен |
| 28 | 30.04.2025 | Глубокое обучение | Чаепитие |
| 07.05.2025 | |||
| 14.05.2025 | |||
| 21.05.2025 | |||
| 28.05.2025 | |||
| 04.06.2025 | |||
| 11.06.2025 | |||
| 18.06.2025 | |||
| 25.06.2025 | |||
| Список используемой и рекомендованной литературы | |||
| 1 | Билл Л. Простой Python. Современный стиль программирования. | ||
| 2 | Брантон С. Л., Куц Д. Н. Анализ данных в науке и технике. | ||
| 3 | Дайзенрот М. и др. Математика в машинном обучении. | ||
| 4 | Джоэл Г. Data Science: Наука о данных с нуля. | ||
| 5 | Кадурин А., Николенко С., Архангельская Е. Глубокое обучение. Погружение в мир нейронных сетей. | ||
| 6 | Коул и др. Искусственный интеллект и компьютерное зрение. Реальные проекты на Python, Keras и TensorFlow. | ||
| 7 | Мюллер, Массарон: Глубокое обучение для чайников. | ||
| 8 | Савельев В. Статистика и котики. | ||
| 9 | Фостер Д. Генеративное глубокое обучение. Как не мы рисуем картины, пишем романы и музыку. | ||
| 10 | https://pythontutor.com/ | ||
| 11 | https://www.codecamp.ru/tag/pythontuts/ | ||
| 12 | https://education.yandex.ru/handbook | ||